iT邦幫忙

2023 iThome 鐵人賽

DAY 12
0

首先,不要誤會,這邊講的Pandas不是指可愛的熊貓喔,Pandas是一個在Python裡幫忙進行數據處理和數據分析的一個非常好用的小套件,他讓我們在看表格類的資料時非常方便。

Pandas主要可以分為Series和DataFrame兩部分,Series是用來處理一行或一列的單項資料時用到的,而DataFrame則是處理二維的多項資料。

程式講解:

首先有一件用所有套件之前都要做的事情,就是要先導入套件集。

import pandas as pd

先來講一下一維的部分,假設一個pandas的一維陣列[1,2,3,4]

s = pd.Series([1, 2, 3, 4])
s

我們可以利用index與values屬性,取得series的陣列與值。

s[0]

查看陣列中最大值及最小值用max()和min()函數

print(s.min())
print(s.max())

查看陣列中的值,可以利用索引值來確認

s.index
s.values

二維的部分我們可以把他當作Python中的Excel

import pandas as pd

last_names = ['Connor', 'Connor', 'Reese']
first_names = ['Sarah', 'John', 'Kyle']
df = pd.DataFrame({
  'first_name': first_names,
  'last_name': last_names,
})
df

除此之外,Pandas也可以讓我們在Python中讀取一些不是.py檔或.ipynb的檔案,常見的有csv、excel、sql、json、html等檔案,但在讀資料之前需要先將檔案放進Python的程式路徑裡面。

pd.read_csv("檔名")

上一篇
Day11-混淆矩陣(Confusion Matrix)
下一篇
Day13-Matplotlib
系列文
機器學習不難嘛30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言